/*
 * To change this license header, choose License Headers in Project Properties.
 * To change this template file, choose Tools | Templates
 * and open the template in the editor.
 */
package com.seari.bean;

import java.util.Map;
import java.util.Set;

/**
 *
 * @author Rainbow
 */
public class IndexDoc
{
/**
     * url的md5 hash，主键
     */
    public String guid;

    /**
     * key
     */
    public String orGuid;

    /**
     * 来源站点名字
     */
    public String sourceSiteName;

    /**
     * 链接地址
     */
    public String url;

    /**
     * 作者
     */
    public String author;
    /**
     * 作者Id
     */
    public long authorId;

    /**
     * 标题
     */
    public String title;

    /**
     * 内容
     */
    public String content;

    /**
     * 页面源码
     */
    public String pageSource;

    /**
     * 保存的图片url在文章中的对应关系
     */
    public Map<String, String> imagesUrls;

    /**
     * 高亮显示标题
     */
    public String titleLight;
    /**
     * 高亮显示内容
     */
    public String contentLight;

    /**
     * 发文时间
     */
    public long tmPost;

    /**
     * 最后回复时间
     */
    public long tmReply;

    /**
     * 摘要
     */
    public String abContent;

    /**
     * 基于标题的md5 hash值，用于同主题文章判断
     */
    public String matchCode;

    /**
     * 回复数
     */
    public int replyCount;

    /**
     * 阅读数
     */
    public int readCount;

    /**
     * 转载数
     */
    public int copyCount;

    /**
     * ‘赞’数
     */
    public int likeCount;

    /**
     * 站点fid
     */
    public int fid;

    /**
     * 站点rfid
     */
    public int rfid;

    /**
     * 版面bid
     */
    public int bid;

    /**
     * 采集时间
     */
    public long tmSpider;

    /**
     * 更新时间
     */
    public long tmUpdate;


    /**
     * 关键词列表
     */
    public String[] keywords;

    /**
     * 文章内容中包含的图片url地址，如果有的话
     */
    public String[] imageUrls;

    /**
     * 系统专题（分类）id列表
     */
    public Set<Integer> sysLids;

    /**
     * 索引操作类型（插入I、删除D、局部更新U，全更新F）
     */
    public char op;

    /**
     * 是否需要立即提交
     */
    public boolean needCommit = false;

    /**
     * 采集文章的spider类型, 参考{@link com.chonseng.webmon.common.SpiderType}
     */
    public int spiderType;

    /**
     * 所属地域代码
     */
    public Set<Long> areas;

    /**
     * 内容中包含的URL
     */
    public String[] enclosingUrls;

    /**
     * 重要性
     */
    public double importance;    // The overall predicted importance of the article. Should be indexed by search engine.

    /**
     * 处理状态
     */
    public int stage;

    /**
     * 存储时间
     */
    public long tmStore;

    /**
     * 是否是回帖
     */
    public boolean isReply = false;


    /**
     * 文章是否已被网站删除
     */
    public boolean deleted;


    /**
     * 站点地域
     */
    public long websiteArea;

    /**
     * 是否已经采集过回帖
     */
    public boolean hasCollectReply;

    /**
     * 文章发文地点经纬度
     */
    public double[] coordinates;

    /**
     * 文章发文地点
     */
    public String address;

    /**
     * 来源,微博使用
     */
    public String source;

    /**
     * 屏幕名
     */
    public String screenName;

    /**
     * 视频地址
     */
    public String[] videoUrl;

    /**
     * 用户id(暂时只存了微博用户id)
     */
    public long uid;

    /**
     * 转发微博的id
     */
    public long retweetId;

    /**
     * 判别是否为初始化采集的文章
     */
    public boolean isInitArticle = false;


    /**
     * 默认构造函数
     */
    public IndexDoc()
    {

    }
}
